28. 标签数据和准确性

标记的数据和准确性

标签

标签是附加到特定图像上的标记,它能向你提供这张图像的相关信息。在本节课中,我们将为每张图像添加标签。这些标签将图像数据分为不同类,而这些类就像一般类别。

对于我们的日/夜图像,我们有两个标签:“日”和“夜”。

我们为什么需要标签?

可以分辨图像是夜晚还是白天,但电脑不能,除非我们用标签来明确告诉它!

当我们测试分类模型的准确性时,这变得尤为重要。

一个分类器接受一个图像作为输入,并应输出一个 predict_label ,告诉我们该图像的预测类。 现在,当我们加载数据时,就像你所看到的那样,我们加载所谓的 true_labels ,它们是图像的 correct 标签。

为了检查分类模型的准确性,我们比较了预测标签和真实标签。如果真实和预测的标签匹配,那么我们已经正确地分类图像!有时标签不匹配,这意味着我们错误地分类了图像。

一个错误的图像的例子。 true_label 是 “day”,而 predict_label 是 “night”。

一个错误的图像的例子。 true_label 是 “day”,而 predict_label 是 “night”。

精确性

在查看许多图像之后,分类器的准确度被定义为正确分类的图像的数量(predicted_label 匹配真实标签的数量)除以图像的总数量。这也就是说,假设我们试图分类 100 张图像,并正确分类了 81张。我们的准确性为 0.81 或 81%!

只有当拥有这些预测和真实标签来进行比较时,我们才能让计算机检查分类器的准确性。我们也可以从分类器所犯的任何错误中学习,这一点我们将在本节课的后面学习。

数字标签

与使用字符串或分类标签相比,使用数字标签是很好的做法,因为它们更容易跟踪和比较。所以,对于这个日/夜图片二进制类的例子,我们不采用“日”和“夜”的标签,而是使用数字标签:0 为夜晚,1 为白天。

你已经熟悉了日/夜图片的数据,并且知道了标签是什么,以及为什么使用它们。现在你准备好接下来的工作了,我们将建立一个完整的分类流程!

先思考一下,我们将采取什么步骤来分类这些图像。